max rank | avg. rank | sentence |
---|---|---|
196 | 86.7500 | Però és com dir de qualsevol altra cosa. |
229 | 44.5333 | ;) I com tot el que es fa a casa, molt millor que la de compra! |
241 | 120.2857 | ! jo també he fet servir aquesta recepta. |
276 | 135.2000 | Hi havia estat dues vegades, però mai tant de temps. |
326 | 135.0000 | Així va el país, o alguns del país van així. |
328 | 98.7778 | Es pot utilitzar en qualsevol moment, a qualsevol lloc. |
335 | 132.7273 | I em sembla que encara ara en sol fer moltes vegades. |
339 | 141.6667 | Per millorar la nostra pàgina web, producte i serveis. |
363 | 136.0909 | Però no tenia massa temps, així que vaig anar per feina! |
371 | 111.7778 | No és una recepta nova… És clar que no. |
445 | 185.7500 | En podeu trobar més informació Què et sembla? |
460 | 118.0000 | Ja només per això, potser ja em sembla que ha fet bé! |
473 | 136.1111 | De fet, la mateixa ciutat és cultura en si. |
484 | 151.5000 | Tots els nostres productes en un sol lloc! |
496 | 240.9167 | Ara ja ho podem posar al forn durant 1 hora 15 minuts. |
556 | 220.9000 | La zona poc tenia a veure amb la imatge actual. |
587 | 210.5000 | Una mostra més de la qualitat dels continguts d’aquest programa. |
600 | 196.9231 | Per això no vaig parlar amb ella i tampoc vaig comprar el llibre. |
603 | 145.0769 | De fet, la gran majoria de coses les faig al cap de setmana! |
614 | 202.5000 | Una mateixa persona, una mateixa família, etc pot estar entre uns o els altres. |
628 | 211.7778 | La bona comunicació amb transport públic amb el centre. |
654 | 122.0909 | I això em sembla el més difícil i el més important. |
656 | 108.7895 | És una part important de la història de Barcelona i hauria de ser part del futur de la ciutat. |
670 | 151.1818 | És molt fàcil arribar fins al centre de Barcelona amb cotxe. |
672 | 236.0000 | Gràcies per les imatges i els continguts! |
725 | 134.7059 | A més, sempre ha estat molt proper i una persona amb qui és molt fàcil de parlar. |
726 | 184.4000 | Em sembla que els dos tenen una mica de raó. |
732 | 221.0625 | Ara pot accedir a tota la xarxa social a un app, tot en un - xarxes socials. |
734 | 208.4167 | La resposta pot ser la diferència entre ser persona o no, potser. |
736 | 152.6316 | ;) I com també en va tenir aquí, per això em vaig decidir a fer aquesta versió en format pastís. |
The maximum word rank of a sentence is by definition the rank of the rarest word in the sentence. If it is low, all words in the sentence are of high frequency. For this reason the table of the sentences with least maximum word number might be of interest. In the table, we see the corresponding sentences with a minimum length of 40 characters.
The over all distribution of the maximum rank in all sentences of the corpus is shown in a diagram with log-scaled x-axis.
The sentences in the table described above are of interest because they are usually easy to understand. The distribution may give insights into the corpus and may give parameters for language comparison.
While the distribution might be deduced from a small corpus, the sentences in the table are rare and a large corpus will give more impressive results.
Table data:
select max(w_id)-100 as m, avg(w_id)-100 as a, s.sentence from sentences s, inv_w i where s.s_id=i.s_id and length(sentence)>40 and i.w_id>100 group by s.s_id order by m limit 30;
Distribution data;
select m, count(*) from (select 100* round((max(w_id)-100)/100) as m from sentences s, inv_w i where s.s_id=i.s_id and i.w_id>100 group by s.s_id) aa group by m;
Explain the distribution, especially the increase in its right part.
4.5.2.2 Average word rank in sentence
4.5.2.3 Sentences consisting of many low frequency words I
4.5.2.4 Sentences consisting of many low frequency words II
4.5.2.5 Sentences consisting of short words only I
4.5.2.6 Sentences consisting of short words only II
4.5.2.7 Sentences consisting of long words only I
4.5.2.8 Sentences consisting of long words only II